互助问答第61期: 面板、TOBIT和OLS选哪个好?
点击蓝字关注我们
今日问题
问题:老师您好:做实证数据相关性分析,样本总数量265,时间周期7年,分别用面板回归、TOBIT、OLS模型做相关性测试,显著情况如表所示(应提问者要求,表未展出)。问题如下:
1、样本数量是否足够?
2、以上结果用哪一个模型结果更理想?这几个模型的优劣势?
3、对实证结果分析是侧重于显著性指标的数量还是显著程度?
今日解答
问题解答:
(1)样本数量是否足够是个很难界定的问题。理论上只有样本量大于参数个数,总是可以估计的;给定能够估计的情况,样本量越大,参数估计的有效性越高,但是我们无法设定一个标准,来判断样本量是否足够大。
(2)面板数据的分析方法有很多,FE,RE,pooled OLS等等,不清楚表中的面板回归指的是哪一种回归。Tobit适用于truncated data;OLS理论上可以适用于任何数据结构。我们无法笼统的讲哪种方法更合适,是否合适需要考虑方法所需要的假设、数据特征、研究的具体问题以及研究目的,判断某一种具体方法的优劣势也是如此。
(3)实证分析可以大概分为两种类型:对相关性的描述性分析和侧重于因果推断的分析。前者一般会同时考察多个解释变量同因变量的关系,此时我们会关心多个解释变量的统计显著性;或者则往往只关注某一个解释变量。我们所关心的变量也并非总是显著才是“好”的,这取决于我们研究的具体问题和待检验的假说。
(4)从统计意义上来说,265个样本是大样本,样本量足够进行实证分析。但是,样本量是否足够还取决于研究主题。如果所选取样本能够很好地反映研究主题,那么265个样本没有问题。例如,有学者研究省级层面问题,谷克鉴和陈福中在《经济研究》发表《净出口的非线性增长贡献——基于1995-2011年中国省级面板数据的实证考察》一文中,样本量为510个;如果所选样本不能很好反映研究主题,即样本没有代表性,则会存在比较大的问题。如果这里的265个样本是研究工业企业相关问题的,则样本就没有代表性。总的来说,样本量是否足够不仅取决于数值,还需要根据研究主题内容判断。
(5)这里给出的估计结果并不全,难以据此直接判断模型好坏。一般来说,当数据为面板数据时,应当采用面板估计,包括固定效应、随机效应和混合效应估计。Tobit模型,又称截尾回归模型或删失回归模型,一般应用在被解释变量取值存在一定限制的情况下。
(6)对回归结果的分析,一般侧重于核心指标的显著性程度。
学术指导:张晓峒老师
本期解答人:张川川老师 任婉婉老师
编辑:李宁宁
统筹:易仰楠 李丹丹
技术:知我者 赵雅轩 郭凯
往期回顾
互助问答第59期:多期DID平行趋势检验以及因子分析累计方差贡献率
长按二维码识别关注我们
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)